智能论文笔记

On confidence intervals for precision matrices and the eigendecomposition of covariance matrices

Teodora Popordanoska , Aleksei Tiulpin , Wacha Bounliphone , Matthew B. Blaschko

分类：机器学习

2022-08-25

矩阵的特征分类是基于基质分解的概率模型中的中心过程，例如主成分分析和主题模型。基于有限样本估计的这种分解的不确定性对于使用此类模型时的不确定性是必不可少的。本文解决了计算固定尺寸协方差矩阵特征向量各个条目的置信界的挑战。此外，我们得出了一种方法来绑定逆协方差矩阵的条目，即所谓的精度矩阵。我们方法背后的假设是最小的，要求存在协方差矩阵，其经验估计量会收敛到真正的协方差。我们利用U统计理论来绑定经验协方差矩阵的$ L_2 $扰动。从此结果，我们使用Weyl定理和特征值 - 元素向量身份获得了特征向量的边界，并使用矩阵扰动界限在精度矩阵的条目上得出置信区间。作为这些结果的应用，我们演示了一项新的统计测试，该测试使我们能够测试精度矩阵的非零值。我们将该测试与众所周知的Fisher-Z检验进行了比较，并证明了所提出的统计测试的健全性和可扩展性，及其在医学和物理领域的现实世界数据中的应用。

translated by 谷歌翻译

HTML版本

Greedy Bayesian Posterior Approximation with Deep Ensembles

Aleksei Tiulpin , Matthew B. Blaschko

分类：机器学习 | 计算机视觉

2021-05-29

独立训练的神经网络的集合是一种最新的方法，可以在深度学习中估算预测性不确定性，并且可以通过三角洲函数的混合物解释为后验分布的近似值。合奏的培训依赖于损失景观的非跨性别性和其单个成员的随机初始化，从而使后近似不受控制。本文提出了一种解决此限制的新颖和原则性的方法，最大程度地减少了函数空间中真实后验和内核密度估计器（KDE）之间的$ f $ divergence。我们从组合的角度分析了这一目标，并表明它在任何$ f $的混合组件方面都是supporular。随后，我们考虑了贪婪合奏结构的问题。从负$ f $ didivergence上的边际增益来量化后近似的改善，通过将新组件添加到KDE中得出，我们得出了集合方法的新型多样性项。我们的方法的性能在计算机视觉的分布外检测基准测试中得到了证明，该基准在多个数据集中训练的一系列架构中。我们方法的源代码可在https://github.com/oulu-imeds/greedy_ensembles_training上公开获得。

translated by 谷歌翻译

CLIMAT: Clinically-Inspired Multi-Agent Transformers for Knee Osteoarthritis Trajectory Forecasting

Huy Hoang Nguyen , Simo Saarakkala , Matthew B. Blaschko , Aleksei Tiulpin

分类：机器学习 | 计算机视觉

2021-04-08

在医疗应用中，建立深度学习方法以自动化诊断任务。然而，从业者通常面临的临床相关问题是如何预测疾病的未来轨迹（预后）。此类问题的当前方法通常需要域知识，并申请复杂。在本文中，我们将预后预测问题标准为来自多式联数据的一对多预测问题。灵感来自临床决策过程，其中两个代理商 - 放射科医生和一般从业者，我们模拟了一种与两个基于变压器的组件进行预后预测问题，该组件在彼此之间共享信息。该模型中的第一个块旨在分析成像数据，第二块利用第一个作为输入的内部表示，也使它们与辅助患者数据一起融合。我们展示了我们预测结构膝关节骨关节炎的发展的方法的有效性随着时间的推移。我们的研究结果表明，该方法在各种绩效指标方面优于最先进的基线。此外，我们经验证明，具有深度为2的多蛋白变压器的存在足以实现良好的性能。我们的代码公开可用于\ url {https:/github.com/mipt-ouru/climat}。

translated by 谷歌翻译

HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D Images

Dmitry Yudin , Yaroslav Solomentsev , Ruslan Musaev , Aleksei Staroverov , Aleksandr I. Panov

分类：计算机视觉 | 人工智能

2022-12-30

We present a novel dataset named as HPointLoc, specially designed for exploring capabilities of visual place recognition in indoor environment and loop detection in simultaneous localization and mapping. The loop detection sub-task is especially relevant when a robot with an on-board RGB-D camera can drive past the same place (``Point") at different angles. The dataset is based on the popular Habitat simulator, in which it is possible to generate photorealistic indoor scenes using both own sensor data and open datasets, such as Matterport3D. To study the main stages of solving the place recognition problem on the HPointLoc dataset, we proposed a new modular approach named as PNTR. It first performs an image retrieval with the Patch-NetVLAD method, then extracts keypoints and matches them using R2D2, LoFTR or SuperPoint with SuperGlue, and finally performs a camera pose optimization step with TEASER++. Such a solution to the place recognition problem has not been previously studied in existing publications. The PNTR approach has shown the best quality metrics on the HPointLoc dataset and has a high potential for real use in localization systems for unmanned vehicles. The proposed dataset and framework are publicly available: https://github.com/metra4ok/HPointLoc.

translated by 谷歌翻译

Support Vector Machine for Determining Euler Angles in an Inertial Navigation System

Aleksandr N. Grekov , Aleksei A. Kabanov , Sergei Yu. Alekseev

分类：机器人 | 人工智能

2022-12-07

The paper discusses the improvement of the accuracy of an inertial navigation system created on the basis of MEMS sensors using machine learning (ML) methods. As input data for the classifier, we used infor-mation obtained from a developed laboratory setup with MEMS sensors on a sealed platform with the ability to adjust its tilt angles. To assess the effectiveness of the models, test curves were constructed with different values of the parameters of these models for each core in the case of a linear, polynomial radial basis function. The inverse regularization parameter was used as a parameter. The proposed algorithm based on MO has demonstrated its ability to correctly classify in the presence of noise typical for MEMS sensors, where good classification results were obtained when choosing the optimal values of hyperpa-rameters.

translated by 谷歌翻译

Uconv-Conformer: High Reduction of Input Sequence Length for End-to-End Speech Recognition

Andrei Andrusenko , Rauf Nasretdinov , Aleksei Romanenko

分类：机器学习

2022-08-16

现代ASR体系结构的优化是最高的优先任务之一，因为它为模型培训和推理节省了许多计算资源。该工作提出了一种基于标准构象模型的新的UCONV-CONFORM-FORM-FORMENTERTURE结构，该模型将输入序列长度始终减少16次，从而加快了中间层的工作。为了解决时间维度的大幅减少解决收敛问题，我们使用与U-NET体系结构相似的UP抽样块，以确保正确的CTC损耗计算并稳定网络训练。UCONV-CONFORMENTER架构在训练和推理方面似乎不仅更快，而且与基线构象异构体相比，它的表现更好。我们最佳的UCONV-CONFORNER模型分别在CPU和GPU上显示了40.3％的时期训练时间缩短，47.8％和23.5％的推理加速度。librispeech test_clean和test_other上的相对WER降低了7.3％和9.2％。

translated by 谷歌翻译

MegaPortraits: One-shot Megapixel Neural Head Avatars

Nikita Drobyshev , Jenya Chelishev , Taras Khakhulin , Aleksei Ivakhnenko , Victor Lempitsky , Egor Zakharov

分类：计算机视觉

2022-07-15

在这项工作中，我们将神经头部的头像技术推向百万像素分辨率，同时着重于跨驾驶合成的特别挑战性的任务，即，当驾驶图像的外观与动画源图像大不相同时。我们提出了一组新的神经体系结构和训练方法，这些方法可以利用中分辨率的视频数据和高分辨率图像数据，以达到所需的渲染图像质量和对新视图和运动的概括。我们证明，建议的架构和方法产生令人信服的高分辨率神经化身，在跨驾驶场景中表现优于竞争对手。最后，我们展示了如何将受过训练的高分辨率神经化身模型蒸馏成一个轻量级的学生模型，该模型是实时运行的，并将神经化身的身份锁定到数十个预定的源图像。实时操作和身份锁对于许多实际应用头像系统至关重要。

translated by 谷歌翻译

Gradient Boosting Performs Low-Rank Gaussian Process Inference

Aleksei Ustimenko , Artem Beliakov , Liudmila Prokhorenkova

分类：机器学习 | (统计)机器学习

2022-06-11

本文表明，基于对称决策树的梯度提升可以等效地重新重新重新构成核法，该方法会收敛到某个内核无脊回归问题的解决方案。因此，对于低级内核，我们获得了与高斯过程的收敛后均值，这又使我们能够轻松地将梯度从后部转化为采样器，从而通过蒙特卡洛估计来提供更好的知识不确定性估计。后方差。我们表明，提出的采样器允许更好的知识不确定性估计值，从而改善了域外检测。

translated by 谷歌翻译

Maximum Entropy Model-based Reinforcement Learning

Oleg Svidchenko , Aleksei Shpilman

分类：人工智能 | 机器学习

2021-12-02

钢筋学习的最新进展证明了其在超级人类水平上解决硬质孕代环境互动任务的能力。然而，由于大多数RL最先进的算法的样本低效率，即，需要大量培训集，因此在实际和现实世界任务中的应用目前有限。例如，在Dota 2中击败人类参与者的Openai五种算法已经训练了数千年的游戏时间。存在解决样本低效问题的几种方法，可以通过更好地探索环境来提供更有效的使用或旨在获得更相关和多样化的经验。然而，为了我们的知识，没有用于基于模型的算法的这种方法，其在求解具有高维状态空间的硬控制任务方面的高采样效率。这项工作连接了探索技术和基于模型的加强学习。我们设计了一种新颖的探索方法，考虑了基于模型的方法的特征。我们还通过实验证明我们的方法显着提高了基于模型的算法梦想家的性能。

translated by 谷歌翻译

Simple End-to-end Deep Learning Model for CDR-H3 Loop Structure Prediction

Natalia Zenkova , Ekaterina Sedykh , Tatiana Shugaeva , Vladislav Strashko , Timofei Ermak , Aleksei Shpilman

分类：人工智能 | 机器学习

2021-11-20

预测其序列的抗体的结构是重要的，因为它允许在卫生行业中发挥至关重要作用的合成抗体的更好设计方法。抗体的大多数结构是保守的。最可变和难以预测的部分是{\ IT第三互补确定区域的抗体重链}（CDR H3）。最近，已经采用了深度学习来解决CDR H3预测的任务。然而，目前的最先进的方法不是端到端，而是它们输出残留的距离和方向，以与基于统计和物理的方法一起使用这种附加信息来预测3D结构。这不允许快速筛选过程，因此抑制靶向合成抗体的发育。在这项工作中，我们介绍了一个端到端模型来预测CDR H3环路结构，其在准确性方面与最先进的方法执行，但数量级更快。我们还提出了一个常用的RosettaAntibody基准测试，该基准导致数据泄漏，即列车和测试数据集中的相同序列的存在。

translated by 谷歌翻译